第 11 屆 iThome 鐵人賽
分享至
前面的章節有提到,常常進行數據分析時,能使用的資料就是有限。什麼叫做有限呢?就是比(其實)你可以拿到的總數少,甚至有沒有代表性都不知道。而這種東西,就叫做取樣(sampling)。
這個問題牽涉的範圍,就是所謂的穩定性(堅實性,robustness)。穩定的東西不容易產生大的變化,就像是緩衝溶劑,就像是海洋。少量特異的資料,無法實質撼動其餘的一般化定則,這就是穩定性。
IT邦幫忙